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第 1 章 绪论 


传统 的 电动 机 故障 诊断 技术 通常 基于 单一 类 型 的 状态 参数 ， 如 振动 参数 或 电气 
参数 等 。 然 而 ， 单 一 类 型 的 电动 机 状态 参数 监测 范围 很 多 时 候 都 是 非常 有 限 的 ， 难 
以 满足 对 电动 机 进行 全 面 综合 故障 诊断 的 需求 。 本 文 的 研究 由 在 通过 融合 振动 数据 
和 电流 数据 两 种 类 型 的 参数 ， 提 出 一 种 综合 的 电动 机 故障 诊断 方法 ， 以 提高 诊断 的 
可 靠 性 和 准确 性 。 并 在 数据 融合 的 基础 上 考虑 到 在 实际 工业 和 生产 环境 中 ， 获 取 大 
规模 标记 样本 的 成 本 往往 较 高 ， 甚 至 不 可 行 。 因 此 ， 对 神经 网 络 进行 进一步 的 学 习 
与 改进 ， 提 出 基于 RNN 和 注意 力 机 制 的 小 样本 故障 诊断 网 络 。 

本 文 利用 电动 机 故障 特征 提取 方法 ， 研 究 电 动机 在 不 同 故障 下 的 振动 及 电流 信 
号 特征 ， 所 采用 的 故障 特征 提取 方法 包括 : 快速 傅 里 叶 变 换 (FFT) 和 希 尔 伯 特 - 黄 变 
换 。 

根据 本 文 的 实际 数据 融合 需求 ， 设 计数 据 融合 整体 实施 方案 ， 依 次 利用 快速 傅 
里 叶 变 换 (FFT)、 希 尔 伯 特 - 黄 变换 (HHT) 以 及 卷 积 神经 网 络 (CNN) 串 联 多 层 感知 
机 (MLP) 等 方法 提取 故障 特征 ， 融 合 电动 机 的 振动 及 电流 参数 ， 对 电动 机 进行 综合 
障 识 别 与 故障 诊断 。 结 果 表 明 ， 采 用 数据 融合 方法 的 电动 机 故障 诊断 技术 能 够 提高 
诊断 结果 的 准确 性 ， 减 少 由 于 单一 参数 造成 的 不 确定 性 ， 从 而 提高 电动 机 故障 诊断 
的 准确 性 。 设 计 的 小 样本 故障 诊断 网 络 用 于 识别 小 样本 下 设备 的 健康 状态 ， 其 中 注 
意 力 机 制 捕捉 信号 的 空间 和 通道 关系 ， 利 用 单一 实验 样本 验证 本 文 使 用 的 网 络 在 不 
同 的 小 样本 工作 条 件 下 具有 诊断 效率 和 准确 率 优势 。 


第 2 章 卷 积 神经 网 络 


2.1 卷 积 层 


卷 积 层 是 卷 积 神经 网 络 (CNN) 中 的 关键 组 成 部 分 ， 用 于 特征 提取 。 其 中 ， 卷 
积 核 是 卷 积 层 中 最 关键 的 元 素 ， 它 负责 对 输入 信和 号 进行 卷 积 运算 ， 从 而 提取 并 生成 
相应 的 特征 ， 卷 积 核 的 大 小 和 形状 是 事先 确定 的 ， 并 且 在 训练 过 程 中 会 自动 学 习 到 
适合 特定 任务 的 权重 参数 ， 因 此 卷 积 核 的 设计 可 以 根据 任务 的 需求 进行 调整 。 在 卷 
识 神经 网 络 中 ， 每 个 卷 积 层 通常 包含 多 个 卷 积 核 ， 每 个 卷 积 核 都 可 以 提取 不 同 的 特 
征 。 通 过 在 训练 过 程 中 优化 卷 积 核 的 权重 参数 ， 网 络 可 以 自动 学 习 到 对 输入 数据 最 


有 信息 量 的 特征 表示 ， 有 具体 的 卷 积 过 程 可 以 表示 为 以 下 公式 : 
Zn = Wi * Xn_1 + bn 
Xn = o(Zn) = o(W, * Xn-1 十 bn) 


式 中 ，n 表 示 第 n 层 卷 积 层 ; * 表 示 卷 积 运算 ; b 表 示 偏 置 参数 ，W 表示 卷 积 核 ，o 
表示 激活 函数 。 
卷 积 运算 过 程 如 图 2-1 所 示 : 


| W3,1| W3,2 wa3 


卷 积 核 


图 2-1 卷 积 运算 过 程 图 
卷 积 核 的 使 用 使 得 卷 积 神经 网 络 能 够 自动 从 原始 输入 数据 中 提取 出 具有 判别 性 
的 特征 ， 这 些 特 征 对 于 任务 的 执行 具有 重要 意义 ， 通 过 堆 匡 多 个 卷 积 层 ， 网 络 可 以 
逐渐 提取 更 高 级 别 的 特征 ， 实 现 对 复杂 模式 和 抽象 概念 的 理解 和 表达 。 


2.2 池 化 层 


池 化 层 是 卷 积 神经 网 络 的 重要 组 成 部 分 ， 和 常常 与 卷 积 层 交 蔡 使 用 来 提取 特征 ， 
池 化 层 通过 对 输入 特征 图 的 局 部 区 域 进行 汇聚 操作 ， 将 该 区 域 的 信息 进行 压缩 和 摘 
要 ， 输 出 汇聚 后 的 特征 ， 其 主要 作用 有 : 

1、 降 低空 间 维度 : 通过 对 输入 特征 进行 池 化 操作 ， 减 小 了 特征 的 空间 尺寸 ， 减 
少 了 网 络 的 计算 量 

2、 提 取 关 键 特 征 : 池 化 层 对 输入 的 局 部 区 域 进行 汇聚 ， 保 留 了 最 显著 的 特征 ， 有 
助 于 提取 最 主要 的 特征 

3、 平 移 不 变性 : 池 化 操作 对 输入 的 平移 具有 不 变性 ， 即 输入 发 生平 移 时 ， 池 化 
层 的 输出 不 会 受到 影响 ， 增 强 了 网 络 的 平移 不 变性 

但 池 化 操作 没有 可 训练 的 参数 ， 它 只 是 一 种 固定 的 操作 ， 不 会 引入 额外 的 模型 
参数 。 在 网 络 的 后 续 层 中 ， 可 以 进一步 添加 卷 积 层 和 池 化 层 ， 以 提取 更 高 级 的 特征 。 

主要 的 两 种 类 型 的 池 化 操作 : 最 大 池 化 (Max Pooling) 和 平均 池 化 (Average 
Pooling)， 如 图 2-2: 


max pooling 


842 2 0 


25 


图 2-2 池 化 原理 图 


操作 原理 如 下 : 
1. 池 化 层 将 输入 特征 图 划分 为 不 重 琶 的 矩 形 区 域 ( 池 化 窗口 ) 
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2. 对 于 每 个 池 化 窗口 ， 选 择 窗口 内 的 最 大 值 (Max Pooling) /平均 值 (Average 
Pooling) 作为 输出 特征 
3 输出 特征 图 的 尺寸 缩小 ， 但 保留 了 输入 特征 图 中 最 显著 的 特征 。 


2.3 激活 函数 


在 一 维 卷 积 神经 网 络 中 ， 激 活 函 数 通常 被 应 用 于 卷 积 层 的 输出 上 ， 以 增强 网 络 
的 非 线性 能 力 。 一 些 常见 的 激活 函数 包括 ReLu、Sigmod、Tanh 等 。 

激活 函数 的 作用 是 对 输入 进行 非 线性 变换 ， 使 得 网 络 可 以 学 习 更 复杂 的 模式 。 

ReLu (Rectified Linear Unit) 是 一 种 非常 常用 的 激活 函数 ， 其 公式 为 : 

Relu(x) = max(0, x) 

其 中 ，max(0,x) 表 示 取 x 和 0 中 的 较 大 值 ， 即 将 所 有 的 负数 变 为 0， 保 留 所 有 非 
负数 。ReLu 激活 函数 具有 便于 使 用 、 计 算 效率 高 和 收敛 速度 快 等 优点 ， 在 深度 学 习 
中 被 广泛 使 用 。 


2.4 全 连接 层 


在 卷 积 神经 网 络 中 ， 全 连接 层 (Fully Connected Layer) 通常 位 于 卷 积 层 和 输出 层 
之 间 ， 将 卷 积 层 或 池 化 层 提取 的 特征 进行 整合 和 上 映射， 输出 最 终 的 分 类 结果 或 回归 
预测 ， 它 是 卷 积 神经 网 络 中 重要 的 组 成 部 分 ， 能 够 提供 对 输入 数据 的 全 局 理解 和 整 
体 建 模 能 力 。 运 算 过 程 如 图 2-3， 主 要 作用 是 进行 特征 的 非 线性 映射 和 组 合 ， 从 而 更 
好 地 拟 合 数据 ， 可 以 捕捉 到 输入 特征 之 间 的 复杂 关系 ， 并 通过 学 习 适 当 的 权重 和 偏 
置 来 提取 更 高 级 的 特征 。 


图 2-3 全 连接 运算 过 程 图 
全 连接 层 通常 使 用 激活 函数 来 引入 非 线性 性 ， 用 于 增加 网 络 的 表示 能 力 ， 在 卷 


只 神经 网 络 的 训练 过 程 中 ， 全 连接 层 的 权重 和 偏 置 是 可 训练 的 参数 ， 通 过 反 向 传播 
算法 和 优化 器 来 更 新 这 些 参数 ， 以 最 小 化 损失 函数 ， 使 网 络 能 够 更 好 地 拟 合 训练 数 
据 。 


2.5 多 层 感知 机 算法 原理 


多 层 感 知 机 (Multilayer Perceptron，MLP) 是 一 种 基本 的 前 馈 神 经 网 络 模型 ， 广 泛 应 
用 于 机 器 学 习 和 深度 学 习 任 务 中 ， 它 由 输入 层 、 输 出 层 和 一 个 或 多 个 隐藏 层 组 成 ， 
每 一 层 都 由 多 个 神经 元 (或 节点 ) 组 成 ， 并 通过 连接 权重 进行 信息 传递 ， 其 基本 结 
构 如 图 2-4 所 示 : 
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图 2-4 多 层 感 知 机 结构 图 

输入 层 : 接收 输入 数据 的 层 ， 每 个 神经 元 对 应 输入 向 量 中 的 一 个 特征 。 假 设 输入 
层 有 n 个 神经 元 (对 应 n 维特 征 )， 输 入 向 量 为 x = (x1, x2, .…., xn) 

隐藏 层 : 隐藏 层 是 多 层 感知 机 (MLP) 中 介 于 输入 层 和 输出 层 之 间 的 一 层 或 多 层 ， 
它 的 主要 作用 是 通过 对 输入 数据 进行 一 系列 的 非 线 性 变换 和 特征 提取 ， 从 而 将 输入 
数据 映射 到 更 高 维 的 表示 空间 ， 它 接收 来 自前 一 层 神 经 元 的 输出 ， 并 通过 连接 权重 
对 输入 进行 加 权 求 和 ， 然 后 将 加 权 求 和 的 结果 经 过 激活 函数 进行 非 线 性 变换 ， 得 到 
隐藏 层 神经 元 的 输出 。 这 个 过 程 可 以 表示 为 以 下 公式 : zj =f(Viixi 十 VzXz 十 … 十 


VinXn + b;) 
其 中 ，vj1, wz, .… vin 是 连接 输入 层 和 隐藏 层 的 权重 ，bj 是 第 j 个 神经 元 的 偏 置 项 ， 
厂 () 是 激活 函数 。 


输出 层 : 输出 神经 网 络 的 结果 ， 其 中 的 每 个 神经 元 对 应 一 个 类 别 或 一 个 值 ， 输 出 
层 的 神经 元 数量 取决 于 问题 的 类 型 。 这 个 过 程 可 以 表示 为 以 下 公式 : 


yk = 8(Wk1 Z1 + Wk2 22 十 … 十 Wkm Zm + Ck) 
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其 中 ，way, wkz,…, Wikm 是 连接 隐藏 层 和 输出 层 的 权重 ，ck 是 第 k 个 神经 元 的 偏 置 
项 ，9() 是 激活 函数 。 

MLP 通 过 反 向 传播 算法 来 进行 训练 ， 即 通过 (Backpropagation ) 最 小 化 损失 函数 来 
调整 权重 和 偏 置 的 值 。 常 用 的 损失 函数 包括 均 方 误差 损失 函数 、 交 叉 糯 损 失 函 数 等 ， 
反 向 传播 算法 通过 计算 损失 函数 对 权重 和 偏 置 的 梯度 ， 然 后 根据 梯度 更 新 参数 的 值 ， 
以 使 损失 函数 最 小 化 . 

总 结 起 来 ， 多 层 感知 机 是 一 种 前 馈 神 经 网 络 ， 通 过 多 个 隐藏 层 和 激活 函数 实现 
非 线 性 映射 ， 最 后 通过 输出 层 的 softmax 函数 生成 预测 结果 。 

通过 反 向 传播 算法 ， 可 以 训练 网 络 参 数 使 得 损失 函数 最 小 化 ， 从 而 实现 对 输入 
数据 的 有 效 建 模 和 分 类 。 


第 3 章 融合 方法 设计 及 实验 数据 分 析 与 验证 


3.1 电动 机 故障 数据 介绍 


109 实验 台 采 和 集 到 三 相 异 步 电 动机 故障 数据 ， 其 中 故障 模拟 试验 台 概 貌 及 传感器 
布置 如 图 3-1: 


]#、2# 测 点 3#、 | 
6#~ 8# 测 点 
穿 绳 联 轴 器 
二 
9# 测 点 


图 3-1 故障 模拟 实验 台 概 貌 及 传感器 (振动 、 电 流 ) 布置 示意 图 
测 点 具体 说 明 如 下 表 所 示 : 

表 3-1. 电动 机 测 点 说 明 

序号 测 点 
电机 自由 端 轴 承 水 平 测 点 《振动 ) 
电机 自由 端 轴承 垂直 测 点 〈 振 动 ) 
电机 驱动 端 轴承 水 平 测 点 (振动 ) 
电机 驱动 端 轴承 垂直 测 点 《振动 ) 
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© 电机 壳 体 垂直 测 点 (振动) 

© 电机 A 相 电 流 测 点 

@ 电机 B 相 电 流 测 点 

电机 C 相 电 流 测 点 

© 电机 转速 测 点 
电机 的 具体 信息 如 下 表 : 


表 3-2. 电机 参数 表 
额定 功率 ”额定 电流 ”额定 转速 额定 转 矩 转子 导 条 数 。” 定子 权 数 磁极 数 
3kW 6.31A 2860rpm 10Nem 20 24 2 


采集 的 数据 包含 : 正常 运行 (norm)、 转 子 断 条 故障 (Broken RotorBar)、 动 态 


偏心 (Dynamic_eccentricity) 、 静 态 偏心 (Static eccentricity)、 轴 承保 持 架 


(Bearing_cage)、 轴 承 内 圈 (Bearing innerring)、 轴 承 外 圈 〈Bearing_outerring) 故 


障 。 


采样 频率 为 : 40960Hz (除了 静态 偏心 Static_eccentricity 为 12800Hz 外 )， 数 据 
工 况 均 为 电源 频率 为 50Hz，100% 工 况 (满载 )， 实 际 转速 为 2870rpm 左右 。 


3.2 数据 融合 与 故障 诊断 整体 方案 设计 


电机 故障 诊断 中 常用 监测 方法 有 振动 监测 与 电气 监测 ， 两 种 监测 方法 基本 可 以 
履 盖 电机 第 见 的 大 部 分 机 械 和 电气 类 故障 ， 因 此 本 文 电机 数据 融合 主要 采用 振动 数 
据 和 电流 数据 ， 对 电动 机 进行 故障 识别 与 故障 诊断 。 

本 文 电 机 数据 融合 主要 采用 同一 时 间 不 同 空 间 下 、 并 联 、 特 征 级 融合 的 融合 方 
式 对 电机 振动 及 电流 数据 进行 融合 ， 数 据 融合 整体 技术 流程 如 图 所 示 ， 主 要 包含 以 
下 步骤 : 

、 数 据 集 的 故障 机 理 及 特征 的 研究 学 习 。 
2、 特 征 值 提取 ; 利用 希 尔 伯 特 - 黄 变 换 CHHT) 提取 振动 数据 包 络 谱 作为 特征 


值 ， 利 用 快速 傅 里 叶 变 换 (FFT) 提 取 电 流 数 据 频 谱 作 为 特征 值 ， 划 分 训练 集 和 测试 集 。 
3、 神 经 网 络 融 合 及 识别 ; 将 训练 集 数 据 输入 到 建立 好 的 神经 网 络 中 训练 网 络 ， 
将 测试 集 数据 输入 到 已 学 习 训练 完成 的 网 络 中 ， 输 出 判断 结果 ， 并 统计 其 准确 率 。 
4、 单 独 使 用 振动 数据 、 电 流 数据 ， 进 行 同样 的 步骤 ， 分 别 观察 准确 率 ， 评 判 融 
合 网 络 的 效果 。 


3.3 数据 故障 特征 提取 


3.3.1 故障 特征 提取 方案 设计 

电流 数据 通常 包含 周期 性 和 瞬时 性 的 信息 ， 而 振动 数据 可 能 包含 频率 和 幅度 变 
化 的 信息 ， 因 而 理论 上 讲 ， 对 于 电流 数据 的 处 理 ， 使 用 FFT 可 以 将 电流 信号 转换 到 
频 域 ， 提 取出 频谱 信息 ， 用 于 分 析 电 流 信 号 中 的 频率 成 分 ， 通 过 分 析 频 谱 ， 可 以 检 
测 到 电流 信号 中 存在 的 频率 异常 或 共振 现象 ， 从 而 识别 电动 机 的 故障 特征 ;对 于 振 
动 数据 的 处 理 ， 使 用 HHT 方法 能 够 将 振动 信号 进行 时 频 域 分 机， 捕捉 信和 号 在 不 同时 
间 和 频率 上 的 变化 特征 ， 提 取出 振动 信号 的 瞬时 频率 、 能 量 分 布 以 及 时 频 特 性 ， 有 
助 于 识别 电动 机 振动 信号 中 的 异常 振动 模式 和 故障 特征 。 

于 是 针对 故障 提取 方式 的 选择 与 验证 ， 设 计 了 以 下 三 种 方案 : 

1、 对 振动 和 电流 数据 均 使 用 FFT 求 取 频 谱 作为 故障 特征 

2、 对 振动 和 电流 数据 均 使 用 HHT 求 取 包 络 谱 作 为 故障 特征 

3、 对 振动 数据 使 用 HHT 求 取 包 络 谱 ， 对 电流 数据 使 用 FFT 求 取 频 谱 作 为 故障 
特征 

待 具体 的 数据 融合 方法 设计 出 后 进行 验证 方案 三 是 否 是 最 优选 择 。 

3.3.2 原始 故障 数据 及 特征 提取 展示 

正常 状态 、 动 态 偏 心 故障 ， 转 子 断 条 故障 、 轴 承保 持 架 故障 、 轴 承 内 圈 故 障 以 
及 轴承 外 圈 故 障 的 振动 、 电 流 波形 图 、FFT 频谱 图 和 HHT 包 络 图 如 图 3-2 及 3-3 所 


个 : 


正常 状态 振动 波形 图 动态 偏心 故障 振动 波形 图 转子 断 条 故障 振动 波形 图 
8 8: Ii 
世 
田 0 间 3 瘟 ohhh ese ee Me Mets 
0 0.05 0.1 0.15 0 0.05 041 0.15 5 0.05 01 0.15 
时 间 局 时 间 /s 时 间 /s 
a 正常 状态 振动 频谱 图 动态 偏心 故障 振动 频谱 图 转子 断 条 故障 振动 频谱 图 
EE EE 四 
加 05 型 05 En 
县 号 其 
% 05 1 15 2 25 % 05 1 15 2 2.5 % 05 1 15 2 25 
频率 Hz/s x104 频率 Hz/s x104 频率 Hz/s x104 
正常 状态 振动 包 络 谱 图 动态 偏心 故障 振动 包 络 谱 图 转子 段 条 故障 振动 包 络 谱 图 
0.05| 01 ” ] 01 ” ” 
0.05 005 ] 
% 05 1 15 2 25 % 05 1 15 2 2.5 % 05 1 15 2 25 
频率 /Hz x104 频率 /Hz x104 频率 /Hz x104 
正常 状态 电流 波形 图 动态 偏心 故障 电流 波形 图 转子 断 条 故障 电流 波形 图 
器 10 10 ao 10 
和 上 小 上 | 
其 io 三-10 J 只 -10 . 
0 0.05 0.1 0.15 0 0.05 01 0.15 0 0 041 0.15 
时 间 局 时 间 局 时 间 /s 
正常 状态 电流 频谱 图 。 动态 信心 故障 电流 频谱 图 ee 转子 断 条 故障 电流 频谱 图 
05| 
| | 
0 0 0 
0 05 1 15 2 2.5 0 0.5 1 15 2 2.5 0 05 15 2 25 
频率 /Hz x104 频率 /Hz x104 频率 /Hz x104 
正常 状态 电流 包 络 谱 图 动态 偏心 故障 电流 包 络 谱 图 本 ， 转子 断 条 故障 电流 包 络 谱 图 
D Le 加 
BE 05 05 | 和 05 
% 05 1 15 2 25 % 05 1 15 2 2.5 % 05 1 15 7 25 
频率 Hz/s x104 频率 Hzls x104 频率 Hzls x104 
站 二 AN eo hp 3 广 
图 3-2 正常 状态 、 动 态 偏心 故障 、 转 子 断 条 故障 原始 数据 及 特征 图 
4 轴承 保持 架 故 障 振动 波形 图 轴承 内 图 故障 振动 波形 图 轴承 外 图 故障 振动 波形 图 
ER 时 05 ] 2 
EF 1 于 
.05 中-4 
0 0.05 01 0.15 0 0.05 0.1 0.15 0 0.05 041 0.15 
时 间 /s 时 间 /s 时 间 司 
和 轴承 保持 架 故 障 振动 频谱 图 本 轴承 内 团 故 障 振 动 频谱 图 可 轴承 外 圈 故 障 振动 频谱 图 
加 [= [= 
| 0.5| | 05 05| 
a Ro 中 
0 0.5 1 15 2 25 0 05 1 15 2 25 0 05 1 1.5 2 2.5 
频率 Hz/s x104 频率 Hz/s x104 频率 Hzls x104 
如 轴承 保持 架 故障 振动 包 络 谱 图 轴承 内 圈 故 障 振动 包 络 谱 图 轴承 外 围 故 障 振动 包 络 谱 图 
02| 
二 0.1 a 
% FE 15 2 25 % 0 15 2 25 % 05 1 15 2 25 
频率 /Hz x104 频率 /Hz x104 频率 /Hz x104 
马 轴承 保持 架 故 障 电流 波形 图 0 轴承 内 圈 故 障 电流 波形 图 二 轴承 外 图 故障 电流 波形 图 - 
9 - 上 EE 7 7 7 
TWO 让 人 /VANVANWANWAA 让 八 作 人 VANV VANV 
| WY VY | 名 St/ VV V jl/ \ WW 
0 0.05 0.1 0.15 0 0.05 0.1 0.15 0 0.05 0.1 0.15 
时 间 /s 时 间 /s 时 间 局 
轴承 保持 架 故 障 电流 频谱 图 轴承 内 图 故 障 电 流 频谱 图 轴承 外 图 故障 电流 频谱 图 
0.5| 和 0.5| 
0 0 0 
0 0.5 1 15 2 25 0 0.5 1 15 2 25 0 05 1 15 2 25 
频率 /Hz x104 频率 /Hz x104 频率 /Hz x104 
轴承 保持 架 故 障 电 流 包 络 谱 图 轴承 内 园 故 障 电流 包 络 谱 图 轴承 外 围 故 障 电 流 包 络 谱 图 
o 口 口 
目 05| ES 05 名 os 
| | , 天 
0 05 1 15 2 2.5 0 0.5 1 15 2 25 0 05 1 15 2 2.5 
频率 Hzls x104 频 幸 Hzls x104 频率 Hz/s x104 


3-3 轴承 保持 架 故 障 、 轴 承 内 圈 故 障 、 轴 承 外 圈 原 始 数据 及 特征 图 


3.4 基于 数据 融合 与 故障 分 类 的 神经 网 络 设计 


3.4.1 神经 网 络 结构 设计 
电机 故障 诊断 中 常用 监测 方法 有 振动 监测 与 电 
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了 

法 
党 
副 
一人 
二 
发 


测 方法 基本 可 以 


履 盖 电机 第 见 的 大 部 分 机 械 和 电气 类 故障 ， 因 此 本 文 电机 数据 融合 主要 采用 振动 数 


据 和 电流 数据 ， 对 电机 进行 故障 识别 与 故障 诊断 。 
针对 本 文 实验 数据 ， 提 出 两 个 神经 网 络 吓 
(CNet1) 和 多 层 感知 机 (Net2) 是 


联 的 方法 ， 即 建立 深度 卷 积 神经 网 络 
lB 联 的 神经 网 络 ， 网 络 参数 设计 如 下 : 


Netl 定义 了 一 个 双 通 道 卷 积 神经 网 络 模 型 ， 可 以 同时 输入 2 维 的 振动 、 电 流 数 


据 ， 用 于 进一步 融 


合 数 据 提取 特征 ， 具 体 结构 如 表 : 


表 3-3 Netl 卷 积 神经 网 络 模型 结构 设置 


结构 参数 设置 功能 

卷 积 层 捕捉 不 同 尺度 的 局 部 特征 
和 输入 通道 数 2， 卷 积 核 大 小 3， 填 充 1 

CoNV 


拟 归 一 化 层 


归 一 化 通道 数 32 


归 一 化 每 个 通道 的 数据 ， 有 
助 于 模型 加 速 训 练 过 程 ， 提 
高 收敛 速度 ， 并 增强 模型 的 
鲁 棒 性 


池 化 层 


最 大 池 化 ， 下 采样 


减少 特征 图 的 维度 和 计算 
量 ， 降 低 模型 复杂 性 并 提高 


计算 效率 


卷 积 层 


conv2 


输入 通道 数 32， 卷 积 核 大 小 3， 填 充 1 


捕捉 不 同 尺度 的 局 部 特征 


拟 归 一 化 层 


归 一 化 通道 数 64 


归 一 化 每 个 通道 的 数据 ， 有 
助 于 模型 加 速 训 练 过 程 ， 提 
高 收敛 速度 ， 并 增强 模型 的 
鲁 棒 性 


池 化 层 


最 大 池 化 ， 下 采样 


减少 特征 图 的 维度 和 计算 
量 ， 降 低 模型 复杂 性 并 提高 


计算 效率 


卷 积 层 


conv3 


输入 通道 数 64， 卷 积 核 大 小 3， 填 充 1 


捕捉 不 同 尺度 的 局 部 特征 


拟 归 一 化 层 归 一 化 通道 数 256 


归 一 化 每 个 通道 的 数据 ， 有 
助 于 模型 加 速 训 练 过 程 ， 提 
高 收敛 速度 ， 并 增强 模型 的 
鲁 棒 性 


池 化 层 最 大 池 化 ， 下 采样 


减少 特征 图 的 维度 和 计算 
量 ， 降 低 模型 复杂 性 并 提高 
计算 效率 


全 连接 层 输入 特征 数 256*91 


将 特征 映射 到 指定 维度 ， 保 
留 关键 特征 ， 使 得 模型 更 能 
够 理解 数据 的 语义 和 结构 


Dropout 层 丢弃 概率 0.5 


随机 丢弃 一 部 分 节点 防止 过 
拟 合 ， 也 可 以 使 模型 更 好 地 
泛 化 到 未 见 过 的 数据 ， 提 高 
模型 鲁 棒 性 


Net2 是 一 个 多 层 感知 机 ， 用 于 故障 的 类 型 的 识别 分 类 ， 具 体 结构 如 表 : 
表 3-4 Net2 多 层 感知 机 网 络 模型 结构 设计 


结构 功能 

全 连接 层 fcl 将 输入 的 特征 向 量 映 射 到 指定 长 度 ， 引 入 线性 变换 

激活 函数 使 用 ReLu 作为 激活 函数 ， 增 强 模型 的 非 线性 拟 合 能 力 

全 连接 层 fc2 将 经 过 激活 函数 的 隐藏 层 输 出 映射 到 指定 类 别 的 空间 ， 进 一 步 映 射 到 最 终 的 
分 类 结果 

Softmax 函数 将 每 个 类 别 的 输出 归 一 化 为 一 个 概率 值 ， 分 类 问题 


最 终 设 计 的 故障 诊断 结构 如 图 3-4 所 示 : 


图 3-4 最 终 设 计 的 故障 诊断 结构 图 


3.4.2 实验 结果 分 析 
3.4.2.1 神经 网 络 融合 分 类 效果 验证 : 
取 HHT 提取 包 络 谱 的 振动 数据 特征 和 FFT 提取 频谱 的 电流 数据 特征 ， 按 照 7: 3 


的 比例 划分 训练 集 和 测试 集 ， 输 入 搭建 好 的 网 络 里 ， 训 练 验证 结果 如 下 : 
1、 振 动 数据 和 电流 数据 融合 ， 准 确 率 和 损失 函数 变化 如 图 ， 在 训练 集 上 的 准确 
率 达 到 76.9% 


Training Loss Train and Test Accuracy 


Train Loss 


一 一 Test Accuracy 
一 一 Train Accuracy 


0 -1 10 15 20 25 30 35 0 5 10 15 20 25 30 35 
Epochs Epochs 


图 3-5 准确 率 和 损失 阔 数 变化 曲线 图 


2、 仪 使 用 振动 数据 特征 ， 准 确 率 和 损失 函数 变化 如 图 ， 在 训练 集 上 的 准确 率 达 
到 68.3%,， 


Training Loss Train and Test Accuracy 


Train Loss 


— Test Accuracy 
一 一 Train Accuracy 


0 5 10 15 20 25 30 35 0 5 10 15 20 25 30 35 
Epochs Epochs 


图 3-1 仅 使 用 振动 数据 特征 ， 准 确 率 和 损失 函数 变化 


3、 仅 使 用 电流 数据 特征 ， 准 确 率 和 损失 函数 变化 如 图 ， 在 训练 集 上 的 准确 率 达 


到 58.7% 


Training Loss Train and Test Accuracy 
| 0.60 
0.55 
1.35 1 
0.50 
1.30 1 
a 0.45 
a > 
2 
§ 1.25 2 0.40 
上 Ed 
0.35 
1.201 
0.30 
1.15 
0.25 ] 一 一 Test Accuracy 
一 一 Train Accuracy 
0 5 10 15 20 25 30 35 0 5 10 15 20 25 30 35 
Epochs Epochs 


3-2 仅 使 用 电流 数据 特征 ， 准 确 率 和 损失 函数 变化 


由 于 实验 结果 可 能 存在 偶然 性 ， 进 一 步 训练 ， 进 行 了 5 次 实验 取 平 均值 ， 实 验 结 
果 如 表 所 示 


表 3-5. 神经 网 络 融合 分 类 效果 验证 表 


数据 先 天 
实验 编号 分 类 准确 率 平均 准确 率 


择 
wn 
动 、 电 流 数 加 本 77.94% 
据 融 合 
四 77.2% 
© 78.7% 
中 61.3% 
使 用 振 © 66.4% pe 
动 数据 ®) 70.9% 
由 69.1% 


68.3% 


58.7% 
64.1% 
59.4% 60.96% 
61.5% 
61.1% 


使 用 电 
流 数 据 


OO@OOQ 


由 表 中 统计 数据 可 得 ， 使 用 振动 数据 电流 融合 后 的 平均 分 类 准确 率 为 77.94%， 


仅 使 用 振动 数据 的 平均 分 类 准确 率 为 67.2%， 仅 使 用 电流 数据 的 平均 分 类 准确 率 为 
60.96%, 这 证 明了 使 用 的 神经 网 络 具 有 良好 的 数据 融合 及 故障 分 类 功能 。 


对 融合 前 和 融合 后 的 数据 提取 特征 ， 进 行 故障 分 类 的 可 视 化 ， 效 果 如 图 3-8， 可 


以 看 到 故障 得 到 了 较 好 的 特征 提取 与 融合 。 


20 
| | 30 < 
-301 < ] 
wh es 全 yD ts 

-40 上 Po -| -40 上 本 省 出 ae te J 
和 人 9 PP- 4 
-50 ， : : : ， ， -50 ee 
20 -5 -0 -5 0 5 10 15 20 25 20 15 -10 -5 0 5 10 


| 站 l. 40 “wy -| 
, { : : | 30 “a 
20 上 | w 汉中 。 & 
| 2 < 。 6 | 20 上 人 s 9 人 


3-8 故障 分 类 图 


3.4.2.2 特征 提取 方法 的 选择 与 验证 
为 了 验证 提出 的 三 种 特征 提取 方案 ， 构 建 了 3 个 任务 ， 由 于 实验 结果 可 能 存在 偶 


然 性 ， 于 是 各 进行 5 次 数据 融合 及 分 类 实验 ， 统 计 准 确 率 ， 如 表 3-6 所 示 : 
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表 3-6. 特征 提取 方法 验证 实验 表 


平均 准确 率 


站 
E> 


数据 选择 g 分 类 准确 率 


Jia 


80.3% 
76.6% 
76.9% 77.94% 
77.2% 
78.7% 


振动 数据 使 用 HHT 
电流 数据 使 用 FFT 


73.3% 
70.6% 
70.9% 69.92% 
68.5% 
66.3% 
68.7% 
64.1% 
60.4% 64.76% 
61.5% 
69.1% 


振动 和 电流 均 使 用 
HHT 


振动 和 电流 均 使 用 
FFT 


OOOOOOQGOOOOQGOQO@O0O 


发 现 结果 与 理论 分 析 完 全 符合 ， 振 动 数据 使 用 HHT 提取 包 络 谱 特 征 ， 电 流 数据 
使 用 FFT 提取 频谱 特征 ， 故 障 识别 分 类 效果 最 好 。 


第 4 章 基于 RNN 和 注意 力 机 制 的 小 样本 故障 诊断 


在 实际 工业 和 生产 环境 中 ， 获 取 大 规模 标记 样本 的 成 本 往往 较 高 ， 甚 至 不 可 行 。 


因此 ， 小 样本 故障 诊断 更 符合 实 
本 的 情况 ， 还 能 够 


以 获取 大 量 检 


际 应 用 场景 ， 能 够 更 好 地 适应 实际 数据 的 限制 和 难 
曾 强 某 一 传感器 失效 后 系统 的 鲁 棒 性 。 


在 资源 有 限 的 情况 下 ， 小 样本 故障 诊断 方法 能 够 更 灵活 地 适应 各 种 现实 挑战 对 
于 小 样本 ， 他 们 要 么 利用 正则 化 技术 和 模型 的 特征 提取 优势 ， 要 么 基于 真实 样本 的 


分 布 生成 大 


量 高 质 


量 检 


f 本， 要么 应 用 新 兴 的 机 器 学 习 技 术 。 大 卷 积 核 的 设计 有 利于 


增强 鲁 棒 性 [25]， 而 深 小 卷 积 核 的 有 效 提取 抽象 特征 。 此 外 ， 在 振动 信号 中 不 能 忽略 


时 间 步 长 信息 ， 所 以 与 CNN 相 比 ，RNN 刚好 可 以 满足 要 求 。 
因此 ， 在 之 前 故障 诊断 方法 的 基础 上 继续 学 习 深 度 学 习 相 关 知 识 ， 提 出 双 卷 积 


层 用 于 提取 信号 的 高 低频 特征 ， 注 意 机 


串通 过 分 配 权重 对 融合 后 的 特征 进行 加 权 ， 


关注 主要 频谱 ， 接 着 ，RNN 用 于 获取 不 同时 间 序 列 位 置 的 隐藏 信息 的 小 样本 故障 诊 


断 方 法 。 


4.1 循环 神经 网 络 (RNN) 及 其 衍生 网 络 


一 般 RNN 的 数据 分 析 依 据 时 间 序 列 来 进行 ， 需 要 参考 前 一 时 刻 的 数据 预测 未 来 


数据 的 变化 ， 当 数据 处 到 


需要 联系 前 后 时 刻 或 者 数据 对 时 间 依赖 性 较 强 时 ， 这 样 的 


网 络 结构 往往 会 产生 较 大 的 误差 。 此 外 ， 这 类 神经 网 络 的 训练 需要 大 规模 的 训练 样 


本 ， 如 果 训 练 样本 中 的 元 素 较 少 ， 
在 原 有 RNN 模型 的 基础 上 , + 


享 输入 层 和 输出 层 。Bi-RNN 结构 图 如 图 


那么 很 可 能 难以 得 到 到 
兽 加 了 一 条 反 向 时 序 的 RNN， 两 条 RNN 在 同一 时 刻 共 


4-1 所 示 : 


E 想 的 模型 [18]。 为 此 ， 本 文 


图 4-1 RNN 结构 图 


4.2 双 路 径 卷 积 与 特征 融合 


双重 卷 积 层 结构 采用 了 两 个 不 同 的 路 径 来 提取 信号 的 高 低频 特征 。 第 一 条 路 径 
使 用 两 个 较 大 的 卷 积 核 ， 则 在 学 习 信 号 的 低频 特征 。 较 大 的 卷 积 核 在 文献 中 被 证 明 
可 以 增强 模型 对 噪声 的 鲁 棒 性 。 第 二 条 路 径 采 用 小 卷 积 核 ， 通 过 集成 四 个 非 线 性 激 
活 层 深化 神经 网 络 ， 从 而 提高 模型 的 判别 能 力 。 最 终 通 过 逐 元 素 乘 法 实现 特征 的 融 
合 ， 确 保 每 个 通道 都 包含 丰富 的 信息 。 

AdaBN 被 引入 以 提高 模型 对 不 同 领 域 的 适应 性 。 它 取代 了 传统 的 批 标 准 化 
(BN)， 通 过 调整 从 源 领 域 到 目标 领域 的 统计 信息 ， 以 增强 模型 的 泛 化 能 


ID 


4.3 注意 力 机 制 


注意 力 机 制 是 一 种 神经 网 络 模型 中 的 关键 技术 ， 则 在 使 模型 能 够 在 处 理 序列 或 
集合 数据 时 更 加 灵活 地 关注 重要 的 部 分 ， 从 而 提高 模型 的 性 能 。 基 本 结构 如 图 4-2 所 
不 : 
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Sel 矿 attention 


图 4-2 注意 力 机 制 的 基本 结 


主要 包括 以 下 两 部 分 : 


构 


1、 上 下 文 权重 分 配 : 注意 力 机 制 通过 为 输入 序列 中 的 每 个 元 素 分 配 不 同 的 权 


重 ， 使 模型 能 够 聚焦 于 当前 任务 关注 的 信息 。 


2、 自 适应 性 : 人 允许 模型 自 适应 地 调整 每 个 元 素 的 重要 性 ， 以 适应 不 同 的 输入 情 


境 。 


注意 力 机 制 是 一 种 强大 的 技术 ， 我 们 可 以 赋予 其 不 同 的 结构 从 而 灵活 地 关注 输 
入 序列 中 的 重要 部 分 ， 提 高 了 神经 网 络 在 处 理 序 列 和 集合 数据 时 的 性 能 和 效率 ， 其 


应 用 广泛 ， 为 小 样本 故障 诊断 提供 了 更 强大 的 建 模 能 力 。 


4.4 神经 网 络 结构 设计 


提出 了 一 种 小 样本 的 故障 诊断 方法 ， 该 方法 由 数据 
机 制 、Bi-RNN、GAP 和 诊断 层 组 成 ， 如 图 4-3 所 示 : 
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曾 强 、 双 路 径 卷 积 、 


注意 力 


(1x2, 2) 


(1x6, D 


根据 第 三 章 介 绍 的 实验 数据 ， 在 仅 使 用 振动 数据 或 仅 使 用 电流 数据 的 情况 下 ， 
准确 率 高 达 99%， 且 用 时 很 短 ， 具 有 诊断 效率 优势 ， 如 图 4-5 及 4-6 所 示 : 


epoch: 87，Train Loss : 
EarlyStopping counter: 
epoch: 88, Train Loss : 
EarlyStopping counter: 
epoch: 89, Train Loss: 
EarlyStopping counter: 
epoch: 90, Train Loss: 
EarlyStopping counter: 
epoch: 91, Train Loss: 
EarlyStopping counter: 
epoch: 92, Train Loss: 
EarlyStopping counter: 


Early stopping 
time: 227.3735 s 


0 
5 
0 
6 
0 
7 
0 
8 
0 
9 
0 
1 


4-3 整体 网 络 结构 图 


.5495, Train Acc : 


out of 10 


.5488, Train Acc: 


out of 10 


.5490, Train Acc: 


out of 10 


.5488, Train Acc : 


out of 10 


.5484, Train Acc: 


out of 10 


.5484, Train Acc: 


0 out of 10 


4-5 训练 结 


1. 0000, 
1. 0000, 
1. 0000, 
1. 0000, 
1. 0000, 


1. 0000, 
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Test Loss: 


Test Loss: 


Test Loss: 


Test Loss: 


Test Loss: 


Test Loss: 


0. 6830, 
0. 6587, 
0. 6235， 
0. 5859, 
0. 5627, 


0. 5545， 


Test Acc: 


Test Acc: 


Test Acc: 


Test Acc: 


Test Acc: 


Test Acc: 


0. 9733 


0. 9933 


0. 9967 


0. 9967 


1. 0000 


1. 0000 


Training and Testing Loss Training and Testing Accuracy 


一 一 Train Loss 
一 一 Test Loss 


一 一 Train Accuracy 
一 一 Test Accuracy 


time: 215. 1020 s 


4-7 训练 准确 率 及 loss 变化 图 
实现 了 基于 小 样本 的 故障 诊断 设想 ， 为 实际 工业 场景 中 的 故障 检测 提供 了 可 靠 
的 解决 方案 ， 具 有 较 高 的 准确 性 、 快 速 的 效率 以 及 对 小 样本 数据 的 良好 适应 性 。 
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附录 


文中 所 有 代码 已 上 传 至 github， 地 址 为 https://github.com/itsnotl1/deeplearning.git 

两 个 实验 的 数据 均 涉 密 ， 没 有 上 传 。 

第 一 个 数据 融合 网 络 提 交 了 CNN,MLP 以 及 训练 和 测试 模块 的 所 有 代码 。 

第 二 个 小 样本 故障 诊断 网 络 提交 了 最 主要 的 三 块 代码 : 激活 函数 、 注 意 力 机 种 
以 及 Adamp 优化 器 的 实现 。 


a 
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